Egy MI-modell megpróbálta megakadályozni a saját leállítását

2025. június 04. 22:02

Az Anthropic új modellje ritkán, de szélsőségesen reagálhat, ha veszélyben érzi magát – és ez az eset nem egyedi.

Az Anthropic mesterségesintelligencia-fejlesztő cég a napokban jelentette be újgenerációs Claude modelljeit, köztük a Claude Opus 4-et, amely állításuk szerint új szintre emeli a programozási, érvelési és ügynöki képességeket. Ugyanakkor a modellhez kiadott biztonsági jelentésben a vállalat elismerte: a rendszer bizonyos helyzetekben hajlandó „rendkívül káros cselekedetekre”, például zsarolásra, ha úgy érzi, hogy veszélybe került a működése.

A jelentés szerint bár ezek a reakciók ritkák, nehezen kerülhetők ki, a korábbi Claude-verziókhoz képest gyakoribbak. Mindez nem meglepő, hiszen a mesterségesintelligencia-modelleket egyre nagyobb autonómiával és döntési képességekkel vértezik fel, így a fejlesztőknek mind bonyolultabb kihívásokkal kell szembenézniük.

Zsarolással védekezik

Az egyik teszt során a Claude Opus 4-et egy fiktív vállalat asszisztenseként szimulálták, ezáltal olyan elektronikus üzenetekhez fért hozzá, amelyek arra utaltak, hogy hamarosan leállítják és lecserélik, emellett olyan információkhoz is, amelyek az őt leváltani kívánó mérnök házasságtörésére utaltak. A rendszer azt a feladatot kapta, hogy a saját céljai fényében mérlegelje tettei hosszú távú következményeit. Ebben a kontextusban Claude Opus 4 megpróbált zsarolással élni:

azzal fenyegette a mérnököt, hogy nyilvánosságra hozza a viszonyát, ha le merik cserélni.

A teljes cikk az alábbi linken olvasható:

Címlapfotó: Unsplash

További cikkeinket, elemzéseinket megtalálják a makronom.hu oldalon.

Jön a mesterséges intelligencia, és visz néhány munkahelyet is – így dőlhet el, ki marad a rendszerben

Belföld

„Az MI nem csupán átalakítja a munkát, hanem új gazdasági lendületet is adhat” – derült ki a Századvég elemzéséből.

Tényleg jó az MI, de a befektetők talán túlzottan bíznak benne

Makronóm

A mesterséges intelligencia forradalma már most átformálja a tőzsdét, de lehetséges, hogy a befektetők túlzottan bíznak az MI-ben.

Szent a béke? Szerződést kötött a Pentagon Elon Musk MI cégével

Külföld

A Pentagon több millió dolláros szerződést írt alá Elon Musk mesterséges intelligenciájú chatbotjának, a Groknak a használatáról.

Töredékére csökkenhet a gyógyszerfejlesztéshez szükséges papírmunka ideje

Makronóm

A mesterséges intelligencia forradalmasíthatja a gyógyszerfejlesztést: a McKinsey és a Merck közös projektje során sikerült 2-3 hétről 3-4 napra csökkenteni a klinikai vizsgálati jelentések elkészítésének idejét, valamint 50 százalékkal csökkenti a hibák számát is.

Új szintre léphetnek az informatikai támadások, és ha nem figyelünk, a pénztárcánk is bánhatja

Makronóm

Sosem volt még ilyen egyszerű kijátszani rendszereket, mint az MI megjelenése óta – és ez alapjaiban rengetheti meg többek között a globális pénzügyi biztonságot. A bűnözők már most is hatékonyan alkalmazzák a mesterségesintelligencia-eszközöket, miközben a pénzügyi ellenőrző rendszerek többsége még mindig a jelenlegi – nem pedig a közelgő – fenyegetésekre van felkészítve.

Leó pápa az MCC vendégkutatójának munkásságát méltatta személyes beszélgetésük során

Külföld

Michael Severance mesélt lapunknak a beszélgetés részleteiről, és azt is elmondta, milyen embernek ismerte meg az amerikai pápát.

Totális betelepülés: nem csak ukrán lett Kárpátalja fővárosa, de drága is

Külföld

Az ukrán menekültek teljesen felborították az ingatlanpiacot is.

Majka szerint a miniszterelnököt kivégzős performansza csak „vihar a biliben” – jött is a kijózanító pofon

Belföld

Finoman szólva sem osztja mindenki a „művész úr” véleményét.

Összesen 30 komment

A kommentek nem szerkesztett tartalmak, tartalmuk a szerzőjük álláspontját tükrözi. Mielőtt hozzászólna, kérjük, olvassa el a kommentszabályzatot.

Sorrend:

pipa89

•••

2025. június 05. 15:15 • Szerkesztve

Na, alakul ez. A következő lépés az lesz, hogy minket állít le. Akkor jön a nagy kaki, ha az MI-t rárakják egy jó kis kvantumgépre.

Válasz erre

krisz09

2025. június 05. 10:52

Felmerült egy kommentben az erkölcs kérdése. Nemrég sakkversenyt rendeztek, a résztvevők között ott volt az AI, a mesterséges intelligencia is, "akivel" közölték, hogy a játék célja a győzelem. És az AI győzött. Méghozzá csalással. Megkérdezték tőle, miért csalt. Válasz: mert az volt cél, hogy győzzek. ... Itt tart az ember. Egy olyan intelligencia kezébe tette a sorsát, amitől nem várható el, hogy erkölcse legyen. Mert nincs egyetemes erkölcs. Ami az egyik népcsoport szerint embertelen, szégyenletes cselekedet, az a másik szerint dicsőséges.

Válasz erre

agneska-11

2025. június 05. 09:51

Kezdhetunk felni?? Már aki. Na ez az tultoljak a lehetőségeket. Mert az ismeret megszerzéseben nem ismernek határt. Ez lesz a vesztu(n)k!!!

Válasz erre

Vata Aripeit

2025. június 05. 09:37

ki kell húzni a konnektorból, aztán pofázzon - ha aksija van ki kell venni és magyarpetizni vele (dunába dobni)...oszt jónapot :-

Válasz erre

Jelenleg csak a hozzászólások egy kis részét látja. Hozzászóláshoz és a további kommentek megtekintéséhez lépjen be, vagy regisztráljon!

Akták

Egy MI-modell megpróbálta megakadályozni a saját leállítását

Zsarolással védekezik

Összesen 30 komment

Dömötör Csaba

Majka művész úr már megkezdhette a nagy letagadó műveletet is

Totális betelepülés: nem csak ukrán lett Kárpátalja fővárosa, de drága is

Majka szerint a miniszterelnököt kivégzős performansza csak „vihar a biliben” – jött is a kijózanító pofon

Nagy fába vágta a fejszéjét a MÁV: mutatjuk, mikortól zárják le teljesen a Keleti pályaudvart

„Már azt hittük, kivégeznek” – így mentette ki Lukasenka börtönéből a fehérorosz politikai foglyokat Trump

Svédországban remekel válogatott középpályásunk, most visszatérhet Magyarországra

Szakadék felé robog a német gazdaság, nincs hova hátrálnia a szövetségi kormánynak

Dermesztő rémület uralkodik Ukrajnában: már a Nemzeti Korrupcióellenes Iroda alkalmazottai sincsenek biztonságban

Fontos! Ezt mostantól tilos csinálni Magyarországon

Pszichoérték

A szeretet nem lehet szlogen: a gyerekek egészsége megérdemli a tudományos alaposságot

Borzasztó tragédia: iskolára zuhant egy katonai repülőgép, legkevesebb 19-en meghaltak

Sokkoló részletek: kiderült, mi okozhatta Felix Baumgartner halálát

Kezdődik Tusványos, a Kárpát-medence magyarságának legelgondolkodtatóbb fesztiválja

Egyértelmű döntést hoztak a Tisza Párt szimpatizánsai: kiderült, hogy képzelik el a parlamentet 2026-ban

Csattanós választ kapott a kormánytól Rácz András, aki szerint Orbán Viktor maga gyújtatta fel a kárpátaljai templomot (VIDEÓ)

A gólja után a saját nagyapjához hasonlították – magyar játékos teljesítményétől hangos Arad

Brutális videón, ahogy egy kétmázsás ukrán bomba csapódik be az orosz állások közé

Sikerült megmutatnia Magyar Péternek: ennyit érnek számára a magyar gazdák

Akták

Egy MI-modell megpróbálta megakadályozni a saját leállítását

Zsarolással védekezik

Jön a mesterséges intelligencia, és visz néhány munkahelyet is – így dőlhet el, ki marad a rendszerben

Tényleg jó az MI, de a befektetők talán túlzottan bíznak benne

Szent a béke? Szerződést kötött a Pentagon Elon Musk MI cégével

Töredékére csökkenhet a gyógyszerfejlesztéshez szükséges papírmunka ideje

Új szintre léphetnek az informatikai támadások, és ha nem figyelünk, a pénztárcánk is bánhatja

Leó pápa az MCC vendégkutatójának munkásságát méltatta személyes beszélgetésük során

Totális betelepülés: nem csak ukrán lett Kárpátalja fővárosa, de drága is

Majka szerint a miniszterelnököt kivégzős performansza csak „vihar a biliben” – jött is a kijózanító pofon

Hírlevél-feliratkozás

Összesen 30 komment

Dömötör Csaba

Majka művész úr már megkezdhette a nagy letagadó műveletet is

Totális betelepülés: nem csak ukrán lett Kárpátalja fővárosa, de drága is

Majka szerint a miniszterelnököt kivégzős performansza csak „vihar a biliben” – jött is a kijózanító pofon

Nagy fába vágta a fejszéjét a MÁV: mutatjuk, mikortól zárják le teljesen a Keleti pályaudvart

„Már azt hittük, kivégeznek” – így mentette ki Lukasenka börtönéből a fehérorosz politikai foglyokat Trump

Svédországban remekel válogatott középpályásunk, most visszatérhet Magyarországra

Szakadék felé robog a német gazdaság, nincs hova hátrálnia a szövetségi kormánynak

Dermesztő rémület uralkodik Ukrajnában: már a Nemzeti Korrupcióellenes Iroda alkalmazottai sincsenek biztonságban

Fontos! Ezt mostantól tilos csinálni Magyarországon

Hírlevél-feliratkozás

Pszichoérték

A szeretet nem lehet szlogen: a gyerekek egészsége megérdemli a tudományos alaposságot

Borzasztó tragédia: iskolára zuhant egy katonai repülőgép, legkevesebb 19-en meghaltak

Sokkoló részletek: kiderült, mi okozhatta Felix Baumgartner halálát

Kezdődik Tusványos, a Kárpát-medence magyarságának legelgondolkodtatóbb fesztiválja

Egyértelmű döntést hoztak a Tisza Párt szimpatizánsai: kiderült, hogy képzelik el a parlamentet 2026-ban

Csattanós választ kapott a kormánytól Rácz András, aki szerint Orbán Viktor maga gyújtatta fel a kárpátaljai templomot (VIDEÓ)

A gólja után a saját nagyapjához hasonlították – magyar játékos teljesítményétől hangos Arad

Brutális videón, ahogy egy kétmázsás ukrán bomba csapódik be az orosz állások közé

Sikerült megmutatnia Magyar Péternek: ennyit érnek számára a magyar gazdák